【陋室推荐】| 2018-4-13
往期
又来一个新栏目,本栏目主要依据我近期的阅读和科研情况,每周为大家推荐1本书以及2篇论文,主要都会和数据科学、自然语言处理等有关,希望大家会喜欢,也欢迎大家给我推荐大家喜欢的材料,我会根据实际情况推荐给大家!
《数据挖掘与数据化运营实战——思路、方法、技巧与应用》
卢辉
目前,已经有大量的人在学习数据挖掘、数据分析、深度学习等方面的理论和技术,然而对于大多数人而言,模型方法的应用远比模型方法本身重要,如何分析问题和制定解决方案,如何建立模型,这才是解决问题的关键,而不在于用一个新方法,一个高逼格的技术。这本书,把重点放在了解决问题上,怎么利用模型方法,无论是新型的机器学习方法,还是传统的假设检验概率统计方法来解决数据化运营问题,如何分析用户的活跃度,如何分析营销方式投放前后的过程,如何制定决策方案等,令你在具有较好的模型基础上,提升实际的业务能力,能把这种软能力写的比较深刻的书,其实并不少,所以推荐这本书。想要提高实际模型应用能力,问题分析和解决能力的同学可以阅读,非常优秀。
A survey of the applications of text mining in financial domain
B. Shravan Kumar, Vadlamani Ravi
一篇在文本挖掘与金融相关应用的综述性论文,这篇综述无论是对在相关领域的初学者,还是对正在领域中进行文献研究的研究人员,都有很重要的作用。作为一篇领域性综述,这篇文章能够回答这几个关键问题,文本挖掘能在金融领域能做什么,文本挖掘中的那些模型方法能应用在金融领域,文本挖掘分析金融市场的主要流程是什么等,以这篇文章为中心,根据自己的需求找这篇文章的参考文献进行深入阅读,会对研究有很大作用,可以当做是一份比较全面的地图。
An Experiment in Integrating Sentiment Features for TechStock Prediction in Twitter
Tien Thanh Vu, Shu Chang, Quang Thuy Ha, Nigel Collier
社交网络是一个以短文本、多内容、信息复杂为特点的自然语言文本,也是进行情感分析、舆情分析的重要研究对象,本文以twitter为例,详细讲解了twitter文本的处理方法以及群众情绪与股票价格的关系。推荐本文的重点在于,本文提供了大量提升twitter文本有效信息质量的方法,为后续情感分析提供支持。